Disclaimer1) Выложена модель уровня rugpt3small_based_on_gpt2 (125 млн. параметров), то есть *самая маленькая*. С одной стороны это позволяет делать инференс весьма быстро, например на моей rtx 3090 это происходит со скоростью около 0.7 генераций в секунду. С другой стороны, такая маленькая GPT чаще, чем свои более бодипозитивные сестры, выдает
(
Read more... )